Analyse exploratoire d'opinions cinématographiques : co-clustering de corpus textuels communautaires
نویسندگان
چکیده
Résumé. Les sites communautaires sont un endroit privilégié pour s’exprimer et publier des opinions. Le site www.flixster.com est un exemple de site participatif sur lequel se rassemblent plus de 20 millions de cinéphiles qui partagent des commentaires sur les films qu’ils ont ou non aimés. Explorer les contenus autoproduits est un challenge pour qui veut comprendre les attentes des internautes. Par une méthode d’apprentissage non supervisée, nous montrerons qu’il est possible de mieux comprendre le vocabulaire utilisé pour décrire des opinions. En particulier, grâce à une méthode de co-clustering, nous montrerons qu’un rapprochement peut être fait entre des films particuliers sur la base de l’usage d’un vocabulaire particulier. L’analyse des résultats peut conduire à retrouver une certaine typologie de films ou encore des rapprochements entre films. Cette étude peut être complémentaire avec des analyses linguistiques des corpus, ou encore être exploitée dans un contexte applicatif de recommandation de contenus multimédias.
منابع مشابه
Marqueurs de la relation cause-effet : stabilité et variation dans des corpus de nature différente
Résumé : Les marqueurs lexicaux figurent parmi les indicateurs les plus intéressants pour identifier et classer finement des relations terminologiques. Cependant, l’exploitation des marqueurs pour repérer automatiquement ou semi-automatiquement les relations dans des corpus, notamment des corpus associés à des domaines ou à des genres textuels différents, peut soulever des problèmes. Le présent...
متن کاملAnalyse et visualisation d'opinions dans un cadre de veille sur leWeb
Résumé. L’analyse d’opinions est une tâche qui consiste en l’identification et la classification de textes subjectifs. Dans ce travail, nous nous intéressons au problème d’analyse d’opinions dans un contexte de veille sur le Web. Nous proposons une approche pour visualiser les résultats d’analyse d’opinions, basée sur l’utilisation de termes clés. Nous décrivons également la plateforme de veill...
متن کاملLa Classification non Supervisée (Clustering) de Documents Textuels par les Automates Cellulaires
Résumé : Dans cet article nous présentons un automate cellulaire (Class_AC) pour résoudre un problème de text mining en l’occurrence la classification non supervisée (Clustering). Avant de procéder à l’expérimentation par l’automate cellulaire, nous avons vectorisés nos données en procédant à l’indexation des documents textuels provenant de la base de donnée REUTERS 21578 par l’approche Wordnet...
متن کاملTB/HIV Co-Infection Care in Conflict-Affected Settings: A Mapping of Health Facilities in the Goma Area, Democratic Republic of Congo
Background HIV/AIDS and Tuberculosis (TB) are major contributors to the burden of disease in sub-Saharan Africa. The two diseases have been described as a harmful synergy as they are biologically and epidemiologically linked. Control of TB/HIV co-infection is an integral and most challenging part of both national TB and national HIV control programmes, especially in contexts of instability wher...
متن کاملTextual Data Clustering and Cluster Naming
In this paper we present the research a way of clustering textual data based on the thematics approached in the texts and a manner of finding a suitable, humanly readable name for each group. Previous research done on the field of data clustering and thematic extraction is briefly presented, along with observations of their suitability for the intended purpose, and then we propose an approach t...
متن کامل